成组数据的T检验
比较两个独立的、互不影响的实验组之间的平均值是否有显著差异
想要比较两个数据之间不同,到底有没有本质的不同,想象一下,你有两组独立的小白鼠(成组数据),你想知道给它们吃不同的饲料(比如饲料 A vs 饲料 B),它们的体重增长有没有本质上的不同。成组 T 检验就是帮你判断这个“不同”是真的由饲料引起的,还是仅仅因为随机波动造成的巧合
成组
两个样本组是完全独立、互不影响
例子 1: 你随机挑 10 只小白鼠喂饲料 A,再随机挑另外 10 只小白鼠喂饲料 B。这两组老鼠互相不认识,吃的饲料也不同,彼此完全独立。这就叫“成组数据”
例子 2: 你想比较男生和女生的平均身高。你测量了 50 个男生和 50 个女生的身高。男生组和女生组是独立的群体
如何才能使用成组数据的 T 检验
- 独立性:组内观测值互相独立,组间观测值也互相独立
- 正态性:每个组的数据都应该(近似)遵循正态分布
- 方差齐性
方差齐性的检验
计算两组的样本方差
分别计算两组的样本方差
构造 F 值
确定自由度
确立假设
进行检验
对于方差齐性的检验为双尾检验,同样查表,看 F 的接受域和拒绝域在哪里区间中

平均数差异显著性检验
确立零假设
假设:
T 统计量的计算
- 定义配对差值
对于第
- 计算差值统计量
·差值均值:
· 差值标准差:
对于两个独立样本成组 T 检验而言:
- 构建 T 统计量
将问题转化为单样本 T 检验:检验差值均值
等同于:
或者使用这样的方式记忆会更好:
例
我们来一步一步解答这个生态调查问题,判断污染河段鲫鱼的平均体长是否显著小于清洁河段(单尾检验,α=0.05)。
数据准备
污染组(n₁ = 10):
[12.1, 11.8, 13.0, 12.5, 11.9, 12.3, 12.6, 11.7, 12.4, 12.0]清洁组(n₂ = 8):
[14.2, 13.8, 14.0, 13.5, 14.1, 13.7, 13.9, 14.3]第一步:计算平均值和标准差(x̄₁, x̄₂, s₁, s₂)
污染组:
平均值
标准差:
清洁组:
平均值
标准差:
第二步:检验方差齐性
用 F 检验:
查 F 表(自由度 v₁=9, v₂=7, α=0.05):
- 临界值大约为 3.68
因为 F = 2.25 < 3.68,接受原假设,认为方差齐性,可使用合并标准差。
第三步:计算合并标准差 和 t 值
合并标准差:
T 统计量:
第四步:查临界值并做结论
自由度
查单尾 t 表,α = 0.05,df = 16:
- 临界值
因为
结论:
在显著性水平 α = 0.05 下,污染河段鲫鱼的平均体长显著小于清洁河段,即差异具有统计学意义。